IGV基因组浏览器可视化高通量测序数据
IGV是本地浏览测序数据功能最为强大的基因组浏览器,支持多种不同类型的输入格式和不同的显示方式,如峰图、线图、柱状图、Sashimi-plot。同时还可以配合bedtools使用。
新版的Windows IGV分发包中包含了Java运行环境,点击链接http://data.broadinstitute.org/igv/projects/downloads/IGV_Win_2.3.93.zip即可下载,解压后,点击igv.bat文件即可启动。
若启动失败,使用记事本打开并编辑igv.bat文件,在文件的最后新起一行输入pause,保存后,再尝试打开,就可以在Windows下的命令行界面(黑色背景的小框中)看到错误信息,根据信息提示去解决问题。
IGV具体使用如下:
如果基因组未存在于当前列表中,则选择更多从Broad IGV获取对应的基因组信息。若所研究的物种没有被Broad IGV收录,则需要自己构建基因组信息。具体参见前面发过的文章 (在公众号后台输入 IGV基因组索引 即可获取)。
IGV展示所用的bw文件可以直接从bam文件得来。下面列出几个工具和相应的代码辅助转换。考虑到不同样品的测序深度不同,需要根据样品的测序量做一个标准化处理,建议使用deepTools的bamCoverage命令。
IGV是一个界面可操作软件,学习的方式就是每个菜单点开看看,点选下看下效果,比如修改下Track的颜色,Track的高度,纵轴的坐标范围Auto scale, Log scale 或 Data range等方便比较。
如果想比较多个基因的表达峰图,可以先在IGV中添加相应的基因列表,然后针对特定的列表选择view,就可以在一个屏幕显示所有加入的基因。
如果我们要查询的区域很多,可以配合bedtools igv -i input.bed,生成一个脚本,批量捕获多个区域的比对信息或coverage信息。使用Tools - Run Batch Script - 选择bedtools igv的输出结果,即可以看到动画般的截屏界面。完成后,就可以一张张的浏览图片或者传给没有安装IGV的老师或朋友查看。
构建自己的基因组索引
在IGV的菜单栏点击
Genomes
>Create .genome File
,会弹出一个窗口填写需要的信息。输入一个ID和基因组的描述信息,这个ID等同于常见的mm10,会作为构建的基因组索引的名字。
使用
samtools faidx genome.fasta
索引基因组文件,然后输入基因组FASTA格式文件的路径。提供基因注释的
GTF
文件,这个文件可以是拼装基因组预测的基因,也可以是cufflinks
等拼装的转录组的GTF文件。其它的选项可以忽略。
点击
Save
,选择基因组索引文件*.genome
的存储路径。
NGS基础
精品回顾
(错误矫正基金:如果您在阅读过程中发现文字或命令错误,请留言或加小编微信指出,获取红包或累积奖励。希望大家多监督,反馈。适用于所有原创文章。)